| Términos totales | Términos grandes | % | |
|---|---|---|---|
| ORA | 11 | 6 | 54.55 |
| GSEA | 1646 | 132 | 8.02 |
| elim | 198 | 0 | 0.00 |
| weight | 151 | 2 | 1.32 |
| PC | 91 | 23 | 25.27 |
| weight01 | 177 | 8 | 4.52 |
Grafo para los 20 términos más significativos de ORA. Abrir en nueva pestaña para ver en detalle.
Enrichment plot de los 30 términos más significativos de ORA
Grafo de los 20 términos más significativos para GSEA a mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.
Enrichment plot de los 30 términos más significativos de GSEA
Grafo de los 10 términos más significativos para elim. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos.
Enrichment plot de los 30 términos más significativos de elim
Grafo de los 10 términos más significativos para weight. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.
Enrichment plot de los 30 términos más significativos de weight
Grafo de los 20 términos más significativos para PC A mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.
Enrichment plot de los 30 términos más significativos de PC
Grafo de los 10 términos más significativos para weight01. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.
Enrichment plot de los 30 términos más significativos de weight01
Tamaño medio para los términos significativos detectados por cada uno de los métodos
Distribución del IC detectado por cada método
Dichos términos redundantes presentan poco enriquecimiento y por tanto no son biológicamente tan relevantes. Para lidiar con ellos podemos hacer un proceso de filtrado o filtrado doble, y siempre previamente a la clusterizarión, pues de forma inversa la clusterización se vería sesgada por dichos términos.
El paso fundamental reside en la aplicación del WSC, que basándose en el pull total de genes de interés seleccionará aquellos términos con mejor p-valor que en conjunto representen a todo el pull de genes de interés. Este algoritmo no suele tener mucha potencia si se usa de forma aislada, sin embargo, si lo empleamos como una herramienta adicional para el filtrado previo a la clusterización vamos a conseguir una mejor calidad de los clusters. Pese a ello en nuestros datos existen aún términos generales que abarcan una gran cantidad de genes, de forma que alteran el funcionamiento de WSC y pueden afectar negativamente al resultado, por ello antes de aplicar WSC es buena idea eliminar todos aquellos términos con un tamaño superior a 1000 g/t, obteniendo los siguientes resultados.
|
Estandar
|
WSC
|
WSC + Filtrado
|
||||
|---|---|---|---|---|---|---|
| Nº Términos | Enriquecimiento | Nº Términos | Enriquecimiento | Nº Términos | Enriquecimiento | |
| Fisher | 11 | 2.22 | 10 | 2.27 | 5 | 2.88 |
| GSEA | 1646 | 1.01 | 749 | 1.38 | 627 | 1.42 |
| elim | 198 | 5.84 | 193 | 5.77 | 193 | 5.77 |
| weight | 151 | 6.06 | 148 | 6.00 | 146 | 6.06 |
| PC | 91 | 3.36 | 90 | 3.37 | 67 | 4.05 |
| weight01 | 177 | 5.56 | 172 | 5.46 | 164 | 5.66 |
En la tabla superior vemos que si usamos WSC de forma aislada conseguimos descartar algunos términos para todos los métodos; principalmente GSEA que presenta una clara mejoría; sin embargo, su efecto no es muy destacable y en algunos casos incluso empeora el enriquecimiento medio. Al combinar WSC con un filtrado de los términos generales obtenemos unos mejores resultados en todos los casos, con un claro incremento de enriquecimiento en los métodos tradicionales y una sutil mejora en los métodos de control.
Utilizando el porcentaje de solapamiento (PO):
\[ (PO) = \bigg(\frac{\frac{k}{L_1}+\frac{k}{L_2}}{2}\bigg)*100 \]
Siendo k el número de términos compartidos por ambos métodos a comparar, L1 el número de términos del primer métodos y L2 los del segundo. Con ello podemos conocer cuantos términos comparten entre sí los distintos métodos.
Heatmap de las medidas PO para los 6 métodos de enriquecimiento funcional
Relación entre los términos de ORA, GSEA y PC
Relación entre los términos de elim, weight y weight01
Relación entre los 6 métodos de enriquecimiento
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 0 | 0 |
| 5-20 términos | 0 | 0 |
| < 5 términos | 7 | 5 |
| Tamaño medio | 1 | 2 |
| Total | 7 | 5 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 0 | 0 |
| 5-20 términos | 0 | 0 |
| < 5 términos | 4 | 4 |
| Tamaño medio | 1 | 1 |
| Total | 4 | 4 |
Clusterizado mediante simplifyEnrichment para ORA
Clusterizado mediante REVIGO para ORA
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 9 | 24 |
| 5-20 términos | 6 | 24 |
| < 5 términos | 22 | 28 |
| Tamaño medio | 44 | 21 |
| Total | 37 | 76 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 10 | 8 |
| 5-20 términos | 3 | 20 |
| < 5 términos | 17 | 26 |
| Tamaño medio | 20 | 11 |
| Total | 30 | 54 |
Clusterizado mediante simplifyEnrichment para GSEA
Clusterizado mediante REVIGO para GSEA
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 3 | 1 |
| 5-20 términos | 2 | 13 |
| < 5 términos | 6 | 16 |
| Tamaño medio | 18 | 6 |
| Total | 11 | 30 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 3 | 1 |
| 5-20 términos | 2 | 13 |
| < 5 términos | 16 | 15 |
| Tamaño medio | 9 | 6 |
| Total | 21 | 29 |
Clusterizado mediante simplifyEnrichment para elim
Clusterizado mediante REVIGO para elim
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 2 | 1 |
| 5-20 términos | 4 | 8 |
| < 5 términos | 9 | 18 |
| Tamaño medio | 10 | 5 |
| Total | 15 | 27 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 2 | 1 |
| 5-20 términos | 4 | 7 |
| < 5 términos | 13 | 19 |
| Tamaño medio | 7 | 5 |
| Total | 19 | 27 |
Clusterizado mediante simplifyEnrichment para weight
Clusterizado mediante REVIGO para weight
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 0 | 0 |
| 5-20 términos | 3 | 4 |
| < 5 términos | 41 | 35 |
| Tamaño medio | 2 | 2 |
| Total | 44 | 39 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 0 | 0 |
| 5-20 términos | 4 | 3 |
| < 5 términos | 16 | 29 |
| Tamaño medio | 3 | 2 |
| Total | 20 | 32 |
Clusterizado mediante simplifyEnrichment para weight
Clusterizado mediante REVIGO para weight
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 3 | 1 |
| 5-20 términos | 3 | 11 |
| < 5 términos | 13 | 16 |
| Tamaño medio | 9 | 6 |
| Total | 19 | 28 |
| simplifyEnrichment | REVIGO | |
|---|---|---|
| > 20 términos | 3 | 1 |
| 5-20 términos | 2 | 9 |
| < 5 términos | 10 | 18 |
| Tamaño medio | 10 | 5 |
| Total | 15 | 28 |
Clusterizado mediante simplifyEnrichment para weight01
Clusterizado mediante REVIGO para weight01
| IC medio | Media de clusters | Media de tamaño | Total términos | |
|---|---|---|---|---|
| ORA | 3.537291 | 6.0 | 1.5 | 11 |
| GSEA | 4.688392 | 56.5 | 32.5 | 1646 |
| elim | 6.541702 | 20.5 | 12.0 | 198 |
| weight | 6.071653 | 21.0 | 7.5 | 151 |
| PC | 3.139707 | 41.5 | 2.0 | 91 |
| weight01 | 7.034649 | 23.5 | 7.5 | 177 |
| IC medio | Media de clusters | Media de tamaño | Total términos | |
|---|---|---|---|---|
| ORA | 4.544161 | 4.0 | 1.0 | 5 |
| GSEA | 4.018821 | 42.0 | 15.5 | 627 |
| elim | 6.442057 | 25.0 | 7.5 | 193 |
| weight | 6.256874 | 23.0 | 6.0 | 146 |
| PC | 4.098294 | 26.0 | 2.5 | 67 |
| weight01 | 6.737700 | 21.5 | 7.5 | 164 |